# Dataset Derivado: Clean vs Raw

Version: 1.0 | 2026-03-02

## Raw Data
Datos crudos sin procesar de fuentes primarias (PubMed, SciELO, OPS/OMS).
Ubicacion: /data/raw/
Caracteristicas: valores faltantes 8.3%, formatos mixtos, idiomas mixtos

## Clean Data
Datos procesados y estandarizados para analisis.
Ubicacion: /data/clean/
Caracteristicas: 0% valores faltantes, formato CSV/TSV UTF-8, estandar ISO

## Proceso de Limpieza
1. Estandarizacion de nombres de paises (ISO 3166-1)
2. Imputacion de valores faltantes (mediana por grupo)
3. Winsorizing de outliers (IQR, percentil 5-95)
4. Conversion de unidades a escala comun 0-100
5. Validacion de consistencia y rangos

## Tabla Comparativa
| | Raw | Clean |
|-|-----|-------|
| Registros | 74 | 71 |
| Variables | 28 | 24 |
| Faltantes | 8.3% | 0% |
| Formato | Mixto | CSV UTF-8 |

Ver CAMBIOS_REALIZADOS.md para detalles del proceso.